طراحی و پیاده سازی یک سیستم استخراج اطلاعات با استفاده از روش های تطبیقی برای متون غیر ساخت یافته ی زبان فارسی

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر
  • نویسنده حمید خدایی
  • استاد راهنما محمدرضا مطش بروجردی
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1387
چکیده

در پردازش زبان طبیعی، استخراج اطلاعات نوعی بازیابی اطلاعات بوده که قادر به استخراج اطلاعات ساختار یافته از متون فاقد ساختار به وسیله ی الگوهایی از پیش تعریف شده است. در این پروژه، یک روش شبه بی نظارت مبتنی بر خوشه بندی در دو مرحله برای تعیین مناسب بودن، و همچنین طبقه بندی الگوهای استخراج اطلاعات از متن بر اساس نوع آنها طراحی، و برای زبان فارسی پیاده سازی شده است. مرحله ی اول خوشه بندی بر اساس نوع آنها طراحی، و برای زبان فارسی پیاده سازی شده است. مرحله ی اول خوشه بندی بر اساس فرکانس تکرار الگوها و مرحله دوم بر طبق محتویات معنایی آنها انجام می شود که می تواند نوع اطلاعاتی را که هر الگو استخراج می کند نیز به صورت خودکار تعیین کند. آزمایش روش بر روی یک دامنه ی خاص (اخبار زلزله) و یک دامنه ی عمومی تر (اخبار سوانح)انجام یافته و در حالت دامنه ی خاص، چند روش دیگر نیز پیاده سازی شده، و نتایج آنها مورد مقایسه قرار گرفته است. برای پردازش متن، از یک روش تکه سازی مبتنی بر ماشین بردار پشتیبان به همراه الگوریتمی برای تعیین محدوده ی جملات ساده و شکستن جملات مرکب به چند جمله ی ساده استفاده شده است که می تواند یک جمله را به گروه های دستوری تقسیم، و پس از آن، جملات مرکب را به جمله هایی ساده تبدیل نماید. همچنین روش تعیین جزء سخن بر اساس درخت تصمیم نیز استفاده شده است.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

طراحی و پیاده سازی یک سیستم اطلاعات مکانی مردم گستر برای شبکه آب شهری

در دهه‌های اخیر محدودیت منابع آب شهری و فرسودگی خطوط انتقال، عمرکوتاه عناصر شبکه‌ی آب، افزایش شکستگی لوله‌ها و تلفات بالای شبکه‌ها سبب افزایش هزینه‌های اقتصادی و اجتماعی در بهره‌وری از زیرساخت‌های شبکه‌ی توزیع شده است. کمبود اطلاعات، قدمت داده‌های مربوط به شبکه و عدم وجود سیستم اطلاع‌رسانی مکانی حوادث، یکی از بزرگترین مشکلات فراروی مدیریت شبکه‌های انتقال آب می‌باشد. گرچه تهیه‌ی اینگونه داده‌‌ها...

متن کامل

طراحی و پیاده سازی یک سیستم اطلاعات مکانی همراه بافت آگاه برای گردشگران - مطالعه موردی: شهرمراغه

امروزه صنعت گردشگری و جذب گردشگر به‌عنوان یکی از منابع اقتصادی در کشورهایی باسابقه‌ی فرهنگی و تاریخی از جمله ایران، مورد توجه بسیار قرارگرفته است. گردشگران نیاز به اطلاعات ساختار یافته‌ای دارند که در هرلحظه و هر مکان در دسترسشان باشد. این اطلاعات به آن‌...

متن کامل

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دسته­بندی متن از تکنیک­های استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می‌شود به طور کلی هدف یک دسته بند متون، دسته­بندی اسناد در قالب تعداد معینی از دسته­های از پیش تعیین شده می­باشد. هر سند می‌تواند در یک، چند و یا هیچ دسته‌ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دسته­ها قرار می‌گیرد. این موضوع می‌تواند در قالب یک ی...

متن کامل

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دسته­بندی متن از تکنیک­های استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می شود به طور کلی هدف یک دسته بند متون، دسته­بندی اسناد در قالب تعداد معینی از دسته­های از پیش تعیین شده می­باشد. هر سند می تواند در یک، چند و یا هیچ دسته ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دسته­ها قرار می گیرد. این موضوع می تواند در قالب یک ی...

متن کامل

طراحی و پیاده سازی یک سیستم کنترل نیمه‌فعال سازه‌یی با استفاده از میراگر مغناطیسی جدید

در نوشتار حاضر، یک سیستم نیمه‌فعال سازه‌یی با استفاده از یک میراگر مغناطیسی جدید طراحی، ساخته و بر روی یک قاب برشی دو درجه آزادی آزمایشگاهی پیاده‌سازی شده است. در ابتدا بر پایه‌ی نتایج آزمون، پارامترهای مدل میراگر براساس مدل بوک ـ ون شناسایی شدند. در ادامه، کنترل‌کننده‌های قلاب آسمانی و تناسبی ـ مشتق‌گیر ـ انتگرال‌گیر طراحی و بر روی سازه پیاده‌سازی و عملکرد آن‌ها برای یک زلزله‌ی نمونه با استفاد...

متن کامل

طراحی و پیاده سازی یک سیستم اطلاعات مکانی همراه برای به هنگام‌سازی اطلاعات شبکه راه‌های شمال غرب کشور

سیستمهای اطلاعات مکانی همراه از جمله سامانه‌هایی است که با بکارگیری  فناوریهای بی‌سیم، فرآیند اخذ و مدیریت داده مکانی بسیار حجیم در گستره‌های جغرافیایی وسیع را متحول نموده و امکان جمع‌آوری چنین داده‌ای را در مدت زمان کوتاه و با دقت قابل قبول بویژه در تهیه نقشه‌های متوسط مقیاس فراهم نموده است. از طرفی، شبکه راهها جزء مجموعه داده‌های مکانی است که با توجه به نقش زیربنایی آن در کلیه طرحها و برنامه‌...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023